Nhập văn bản Tiếng Việt và máy tính

Bàn phím thuần vật lý cho tiếng Việt thì lại mang tính phi thực tiễn do số lượng cực lớn tổ hợp 'mẫu tự'-'dấu phụ'-'dấu phụ' trong bảng chữ cái. Thay vào đó, việc thâu nhập tiếng Việt đều nhờ vào bố cục bàn phím, bàn phím ảo, hoặc phương thức nhập (còn gọi là IME) dựa trên phần mềm máy tính.

Bố cục bàn phím

Microsoft Windows có kèm một bố cục bàn phím tiếng Việt dựa trên TCVN 6064:1995.

Bố cục bàn phím tiếng Việt nhờ vào các phím chết (en) để tổ hợp mẫu tự với dấu phụ. Hầu hết các hệ điều hành desktop đều kèm một bố cục bàn phím tiếng Việt tương tự như TCVN 6064:1995 (một tiêu chuẩn quốc gia Việt Nam).

Phương thức nhập

Bài chi tiết: Bộ gõ tiếng Việt
xvnkb – bộ gõ có tương thích với X Input Method framework trên các hệ thống Unix – có hỗ trợ 6 bảng mã ký tự cho đầu ra văn bản.

Ba phương thức nhập tiếng Việt phổ biến đó là Telex, VNI, và VIQR. Telex gõ dấu phụ bằng những mẫu tự ít có khả năng xuất hiện tại chỗ cuối của từ ngữ, còn VNI thì dùng lại các phím số hoặc các phím chức năng cho mục đích gõ dấu, và tương tự, VIQR cũng dùng lại nhiều phím dấu câu khác nhau cho việc này. Quy ước gõ Telex và VIQR đều khởi nguồn từ thời kỳ trước kia của lần lượt máy điện tínmáy đánh chữ.

Sự hỗ trợ cho các phương thức thâu nhập đấy đều được các Input Method Editor (IME) cung cấp, tại Việt Nam thì được gọi là bộ gõ. IME có thể được hệ điều hành cung cấp, được cài đặt làm ứng dụng bên thứ ba, được cài đặt làm phần mở rộng trình duyệt (en), hoặc được cung cấp bởi website riêng lẻ dưới dạng kịch bản lệnh. Các ứng dụng phổ thông bên thứ ba gồm có GoTiengViet, UniKey, VietKey, VPSKeys, WinVNKey, và xvnkb. Trên các hệ điều hành giống Unix, hai framework IBusSCIM đều hỗ trợ tiếng Việt. Những IME như AVIM, Mudim, và VietTyping được trang bị trên hầu hết các diễn đàn trực tuyến tiếng Việt, trên Wikipedia tiếng Việt, và trên nhiều 'website có tập trung sâu vào văn bản' khác. Trình duyệt web Cốc Cốc được phát hành kèm với một phương thức thâu nhập dựng sẵn.

Các phương thức nhập giúp tổ hợp các từ ngữ theo trật tự linh hoạt hơn so với những gì mà bố cục bàn phím mang lại. Cho ví dụ, để nhập từ "viết" mà dùng bố cục bàn phím TCVN 6064:1995 thì người ta phải gõ VI38T theo đúng thứ tự. Trái lại, hầu hết các IME đều cho phép người dùng chèn dấu phụ tại chỗ cuối của từ ngữ: theo Telex thì là VIEETS, theo VNI thì là VIET61, hoặc theo VIQR thì là VIET^'. Một số IME thậm chí còn cho phép nhập dấu phụ đằng trước mẫu tự cơ sở. Tùy thuộc vào sự thực hiện của IME, mà người dùng còn có thể sửa đổi dấu phụ của một từ có sẵn mà không phải gõ lại cả từ đó.

Một số IME tiếng Việt có học hỏi một tính năng phổ thông tựu trung các phương thức nhập Tiếng Trung, đó là khả năng cho phép người ta bỏ qua hẳn dấu phụ luôn. Mà thay vào đó, sau khi gõ các mẫu tự cơ sở, bảng danh sách các gợi ý (candidate list) sẽ hiển thị, và người dùng sẽ lựa chọn từ ngữ có dấu phụ mà mình muốn ra khỏi bảng đó. Để có thể cung cấp danh sách tự hoàn thành (en) đấy, IME có thể cần phải giao tiếp với dịch vụ web. Một số IME còn có thể sử dụng danh sách gợi ý để cho người dùng chuyển đổi văn bản từ chữ Quốc ngữ sang chữ Nôm, bởi không hề có ánh xạ một-một tương ứng giữa từ ngữ an-pha-bê với chữ Nôm.

Tài liệu tham khảo

WikiPedia: Tiếng Việt và máy tính http://bogotiengviet.com/fontchu-bangma.htm http://www.enderminh.com/minh/vnconversions.aspx //books.google.com/books?id=SA92uQqTB-AC&pg=PA47 //books.google.com/books?id=aaZABAAAQBAJ&pg=PA37 http://vietstd.sourceforge.net/report/rep92.htm http://vietunicode.sourceforge.net/charset/ http://vietunicode.sourceforge.net/fonts/fonts_han... http://winvnkey.sourceforge.net/express-manual-for... http://winvnkey.sourceforge.net/some-special-funct... http://babel.hathitrust.org/cgi/pt?id=mdp.39015082...